Это сотрудничество возглавил Сорин Истраил, один из ведущих сотрудников группы Джина Майерса, который к тому времени получил должность заведующего отделом биоинформатики в Celera. Проведение анализа заняло больше года и потребовало разработки множества новых вычислительных методов, которые позволили бы впервые сравнить полные геномы человека. Я поделился своими планами с одним из редакторов PNAS, который выразил удовлетворение нашим переходом к политике открытой публикации данных и заявил, что готов помочь в разрешении спора, опубликовав результаты совместного проекта в виде статьи. Наши данные однозначно доказывали точность полной сборки генома методом дробовика. Эта работа, опубликованная в начале 2004 года, позволила тщательно сравнить геномы, расшифрованные нами и участниками государственной программы. Результаты Celera отличались большей упорядоченностью и ориентированностью, а сборка государственного консорциума полнее охватывала повторы. Лаборатории, получавшие средства от государства и Wellcome Trust, вели работу над уточнением своей версии генома в течение четырех лет, что обошлось примерно в 100 миллионов долларов. Сравнительный анализ показал, что на каждом этапе этих исследований «государственная» версия становилась все ближе к версии Celera в плане как последовательности, так и ориентации фрагментов. Расшифровка Celera, в сущности, ликвидировала многочисленные пробелы в «окончательном» геноме, о получении которого участники государственной программы с большой помпой объявили в журнале Nature в 2004 году{218}. Мы же опубликовали свою статью без всяких заявлений для прессы, считая, что полученные данные говорят сами за себя{219}.
Когда открытая вражда пошла на убыль, я стал готовиться к новой фазе исследований генома человека. Итак, коллектив TCAG (после слияния трех из пяти некоммерческих институтов получивший название Института Вентера) приступил к секвенированию и анализу индивидуального генома. Объектом исследования стал я сам, причем не из тщеславия или эгоизма, а по научным причинам. В первых композитных версиях генома, в том числе и полученных Celera, катастрофически недооценивалась его вариативность от одного носителя к другому. «Государственный» геном был собран на основе разрозненных кусочков (клонов), полученных от ограниченного числа лиц, так что генетические вариации в нем были незаметны. Геном Celera представлял собой согласованную последовательность, построенную на основе геномов пяти человек, включая меня самого. Мы пользовались принципом «победителю достается все»: наш расшифрованный геном состоял из участков, которые встречались у большинства доноров. При подобном подходе также терялись вариации, вызванные инделами (полиморфизм за счет инсерций и делеций), то есть участками генетического кода, где изменено более одного нуклеотида. Наша программа сборки замечала существенные инсерции или делеции ДНК лишь в том случае, если они встречались в большинстве последовательностей. Иными словами, обе сборки генома, о которых было с большим шумом объявлено в июне 2000 года, никак не отвечали на вопрос, являвшийся одной из главных причин их расшифровки. В смеси или мозаике ДНК, полученной от разных людей, теряются индивидуальные различия, вызывающие у некоторых лиц предрасположенность к онкологическим, сердечно-сосудистым или другим заболеваниям (хотя, разумеется, делались попытки картировать и снипы, вариации одного нуклеотида). Кроме того, первые работы по расшифровке генома касались лишь одной копии генетического кода конкретного человека, в то время как мы наследуем две таких копии, по одной от каждого родителя. На некоторых участках доминантен ген отца, на других – матери. Для точной расшифровки человеческого генома следовало изучить не три, а шесть миллиардов пар оснований.
По понятным причинам мы с Хэмом никогда не объявляли публично, что входили в число доноров ДНК для первого секвенирования, однако и не скрывали этого. Рассказывая о соревновании по расшифровке генома, телепрограмма «60 минут» сообщила о моем донорстве, однако история с моим геномом заинтересовала публику позднее, после интервью с Николасом Уэйдом из The New York Times о моих новых институтах. Наша беседа не казалась мне особо примечательной, пока в следующую субботу я не получил номер газеты с заголовком на первой полосе: «Ученый раскрывает тайну: расшифрованный геном принадлежит ему самому»{220}. Заголовок не отличался точностью, однако подтверждал старую истину: любое событие становится событием, только когда о нем напишут в The New York Times.
Гены и слепота
В газетах смаковались некоторые малоприятные открытия, связанные с моим геномом. В одной статье, размещенной на первой полосе, описывалось, как «по просьбе газеты The Wall Street Journal сотрудники доктора Вентера проверили его гены, отвечающие за риск тех или иных заболеваний. Так доктор Вентер выяснил, что ему грозит слепота. Что ж, всякое может случиться, когда изучаешь свою собственную ДНК»{221}.
Газета имела в виду, что один из моих генов, известный под названием комплементарного фактора H (CFH), содержал вариацию одного основания (снип rs1061170), которая в ряде исследований связывалась с «весьма высоким» риском макулодистрофии, распространенного заболевания, вызывающего дегенерацию центра сетчатки и резкое ухудшение зрения.
Из двух копий моего гена CFH мутацию содержит только одна, а потому риск заболевания вырастает лишь в 3–4 раза. В случае мутации обоих генов этот риск увеличился бы в 10 раз.
Показано, что ген CFH может играть определенную роль в защите кровеносных сосудов от повреждений, так что его мутация способна вызывать воспаление и, соответственно, слепоту. Одно из известных свойств фактора H состоит в том, что он регулирует активацию системы комплемента, сложный комплекс взаимосвязанных белков, обеспечивающих передний край обороны организма. Эта врожденная система атакует внешних завоевателей, однако не нападает на «свои» здоровые клетки.
Действительно, при расшифровке генома в Celera именно мой геном играл ведущую роль. Как упоминалось в главе 14, группа секвенирования поставила задачу более подробно расшифровать один из пяти изучавшихся геномов с целью повышения точности сборки. В конечном счете, в библиотеки наиболее высокого качества (50 кб) попала ДНК Хэма, однако на ранних этапах исследования, когда формировались библиотеки в диапазоне 2–10 кб, наилучшие результаты были получены из моей ДНК. В целом на долю моей ДНК пришлось 60 % расшифрованного генома.
Рак и мой геном
Многие люди рождаются с мутацией, которая приближает их к онкологическим заболеваниям. Вообще говоря, одни снипы – орфографические ошибки в одну букву гена – резко меняют его поведение, а другие оказывают менее выраженное воздействие, например просто повышая восприимчивость к болезням в соответствии со структурой генов или окружающей средой (так, некоторые гены повышают вероятность развития рака легких у курильщиков, но не оказывают никакого влияния на некурящих). Имеются и недействующие снипы, совсем ни на что не влияющие.
Гены осуществляют кодировку белков, и из перечисленных трех типов снипов наиболее интересны те, что изменяют структуру белков, меняя один из аминокислотных «кирпичиков». Они называются «несинонимическими» снипами. Если говорить о хороших новостях, то поиск мутаций в четырех генах, которые связывают с онкологическими заболеваниями (Her2, Tp53, PIK3CA и RBL2), уже привел к обнаружению в моем геноме двух несинонимичных снипов, по имеющимся данным, не связанных с онкологическими заболеваниями, и двух новых с неизвестным воздействием. Один из этих новых снипов обнаружился в гене PIK3CA в так называемой законсервированной позиции, то есть он обеспечивает синтез участка белка, отличающегося неизменностью (возможно, в силу своей важности).
Неизвестно, подвергает ли меня эта мутация повышенному риску. PIK3CA, однако, принадлежит к семейству генов, кодирующих ферменты липидкиназы, которые изменяют молекулы жиров и командуют ростом, формой и движением клеток. Известно, что мутации PIK3CA наблюдаются во многих (до 30 %) случаях рака прямой кишки, желудка и глиобластомы, а с меньшей частотой – в случаях рака груди и легких. Мутации этого гена могут также спонтанно происходить в опухолях мозга. Возможно, я еще займусь изучением этого вопроса.
Секвенирование генома конкретного человека вызвало споры, как и многое другое в геномике. Члены научно-консультативного совета выступали против идентификации любых доноров. Арт Каплан сравнивал наш проект с могилой неизвестного солдата, сама неизвестность которого священна. В то же время вся цель анализа ДНК средствами современной военно-судебной медицины состоит, в сущности, в том, чтобы в будущем никогда не оставалось «неизвестных солдат». Как и в случае многих былых спорных тем в медицинской науке, от пересадки сердца до искусственного оплодотворения, отношение общества к ним со временем резко меняется. Прекрасной иллюстрацией этому служит известие о том, что геном Джима Уотсона в настоящее время секвенируется компанией 454 Life Sciences, коммерческой фирмой, разработавшей секвенатор на основе открытий шведа Матиаса Улена, изобретателя метода пиросеквенирования.